中文微博的热点话题发现

中文微博的热点话题发现

作者:师大云端图书馆 时间:2023-05-09 分类:硕士论文 喜欢:2198
师大云端图书馆

【摘要】近些年,微博已然成为社会网络一个很重要的的应用,人们通过微博可以在任何地点,任何时间发布自己的所见,所闻,所想。这种较为简易的消息发布方式很大程度上降低了信息发布的壁垒,这也是微博得到广泛应用的重要因素之一。在这些用户发布的微博数据中,多数的微博信息都和现实生活中的事件有所关联。有些微博网站也会在网站主页中列出最近一段时间的热门关键词,但是这些微博主题词通常都很简短、分散,而且与某个话题有关的微博信息是由不同微博发布者在不同时间内发布的。用户不能通过这些孤立信息对事件有一个全面的了解,相关部门也不能完整掌握事态的发展,对微博上的舆论不能进行正确的引导。正是在这种情形下,针对微博数据的热点话题发现逐渐成为一个研究热点。微博热点话题发现就是通过相关的话题检测技术把分散的微博信息组织起来有条理地呈现给人们。本文提出了一个完整的微博热点话题发现方法。该方法主要包括了微博数据的预处理、微博数据的文本表示、特征词提取、文本聚类和事件关键词提取等步骤。文中仔细分析了微博数据自身的特点,结合这些微博数据特征对TF-IDF算法进行改进,提高了微博热点话题发现的效果。本文在微博文本聚类时采用了多属性无向加权图聚类算法,不仅考虑了图的拓扑结构还引入了节点的属性,与目前常用的一些聚类算法相比较提高了聚类的效果。文中给出的一些实验结果表明本文提出的微博热点事件检测算法是有效的。
【作者】檀娟伢;
【导师】郑诚;
【作者基本信息】安徽大学,计算机软件与理论,2014,硕士
【关键词】微博;热点话题;文本聚类;关键词;

【参考文献】
[1]张涛,原国栋.政府应是土地一级开发的主体[J].北京房地产.2005(01)
[2]王小成.北祁连野牛沟—青石嘴—带铜铅锌矿床成矿规律及找矿方向研究[D].中国地质大学(北京),地质工程,2013,硕士.
[3]李鹏飞.HPV38 E6/E7对角质形成细胞自噬的影响及机制探讨[D].第四军医大学,皮肤病与性病学,2014,硕士.
[4]周全.应对气候变化的城市规划“3A”方法研究[D].华中科技大学,城市规划与设计,2013,硕士.
[5]郭喜良.光谱法研究卟啉生物大分子在有序介质中的组装[D].山西大学,分析化学,2004,硕士.
[6]王国敬,穆志纯.基于网络控制系统平均时延的模糊控制器设计[J].控制与决策,2009,08:1214-1217+1222.
[7]黄燕芳.静脉泵注不同剂量右旋美托咪定对患者呼吸力学及镇静深度的影响[D].广州医科大学,麻醉学(专业学位),2014,硕士.
[8]郝春雨.基于视频特征的火灾火焰检测研究[D].大连海事大学,电子与通信工程,2013,硕士.
[9]赵国龙.巴塞尔文件与我国银行表外业务监管[D].大连海事大学,国际法学,2004,硕士.
[10]齐维贵,丁宝.控制系统串联校正的两种新算法[J].冶金自动化,1993,02:38-43+37.
[11]张璇.SIRT1的表达在肝癌发生发展中的作用[D].浙江理工大学,生物化学与分子生物学,2011,硕士.
[12]邓江华.醇与小分子有机溶剂二元双水相分离萃取四环素类抗生素[D].长安大学,环境工程,2013,硕士.
[13]王俊.荧光介孔硅在抗癌药物阿霉素释放中的应用研究[D].西南大学,药物分析,2013,硕士.
[14]刘爽.离心电沉积制备超级电容器正极材料MnO_2/CNTs复合物[D].燕山大学,应用化学,2014,硕士.
[15]陈振宁,吕维松,杨自厚,张宏勋,钟延炯.第五届IFAC采矿、冶金、金属加工自动化会议综述(上)[J].冶金自动化,1987,03:2-6.
[16]杨旭,李隽,王哲昊.对我国潜在经济增长率的测算——基于二元结构奥肯定律的实证分析[J].数量经济技术经济研究,2007,10:14-23.
[17]陆永涛,王丹丹,岳宗款,吴毅杰,杨平.硫化镍修饰类石墨烯C_3N_4复合物制备及其在可见光下制氢性能的研究[A].中国化学会.中国化学会第29届学术年会摘要集——第12分会:催化化学[C].中国化学会:,2014:1.
[18]付睿臣.基于Oracle的管理信息系统开发模式的研究[D].哈尔滨理工大学,2004.
[19]常鹏飞,曾继伦,王彤,陈贤明.三相四线有源电力滤波器直流侧电压控制方法[J].电力系统自动化,2005,08:75-78.
[20]申兵.数据仓库在贵阳电信中的应用[D].重庆大学,2003.
[21]吴大奎.利用K-L变换提高模式识别的精度[J].石油地球物理勘探,1995,02:272-276+291.
[22]徐志江,胡冰璞,张江鑫.基于BP译码算法的准循环低密度奇偶校验码量化问题研究[J].浙江工业大学学报,2014,03:260-264.
[23]刘承军,姚鹏.首钢球团厂成功实施上料系统计控改造[J].冶金自动化,2008,06:21.
[24]陈聪.唐代贪污贿赂性质犯罪研究[D].西北大学,法学(专业学位),2014,硕士.
[25]刘凤根.有效市场理论及其在中国证券市场的应用研究[D].湘潭大学,2004.
[26]徐怡静.面向节能减排的车载导航路径优化方法研究[D].燕山大学,车辆工程,2014,硕士.
[27]赵小娟.初中思想品德课教学中法制教育研究[D].苏州大学,学科教学(专业学位),2012,硕士.
[28]韩涛,张春海,李华.基于RFM和事务压缩的改进型Apriori算法研究[J].计算机工程与应用,2005,26:184-187.
[29]郭瑞红.大学生实验探究能力现状及发展策略研究[D].东北师范大学,学科教学,2012,硕士.
[30]马佳.富士康成都科技园人力资源培训管理体系建设研究[D].吉林大学,工商管理,2014,硕士.
[31]史清元.马克思恩格斯生态经济思想探析[D].东北大学,马克思主义基本原理,2010,硕士.
[32]苗立中.副猪嗜血杆菌荧光定量PCR方法建立及其分离株高密度发酵研究[D].吉林大学,兽医,2012,硕士.
[33]李兵,薛劲松,朱云龙,王扶东.面向客户的CRM体系结构研究[J].计算机工程与应用,2003,15:30-31+70.
[34]张友民,李庆国,戴冠中,张洪才.一种RBF网络结构优化方法[J].控制与决策,1996,06:667-671.
[35]高培.基于自组织模糊神经网络在脑机接口中的应用及其研究[D].江南大学,计算机应用技术,2012,硕士.
[36]叶青.脂代谢相关miRNA靶基因结合区域多态性与代谢综合征及其组分的分子流行病学研究[D].南京医科大学,流行病与卫生统计学,2013,硕士.
[37]索珂.保险公司顾客满意度测评体系研究及其实证分析[D].四川大学,2004.
[38]马義超.基于语料库的中国非英语专业英语学习者的Be动词过度使用和零使用影响因素的研究[D].新疆师范大学,外国语言学及应用语言学,2013,硕士.
[39]朱晓燕.水权转让合同初论[D].河海大学,环境与资源保护法学,2004,硕士.
[40]王文莉.个性化智能化搜索的竞争现状及发展前景[J].现代情报,2005,03:76-80.
[41]吕大伟.竞技武术优秀南拳运动员身体素质评价体系及实证研究[D].北京体育大学,体育教育训练学,2013,硕士.
[42]李艳成.浅谈数据挖掘技术[J].石油工业计算机应用,2003,04:31-33+7.
[43]闫继位.3kW斯特林发动机的模拟和分析[D].华中科技大学,制冷及低温工程,2012,硕士.
[44]张蕾.AGARCH模型及多维常数相关GARCH模型的统计分析[D].西北工业大学,应用数学,2004,硕士.
[45]李亚文.我国军民企业技术融合模式的演化博弈论分析[D].吉林大学,国防经济,2014,硕士.
[46]王威.云制造的资源服务应用模式研究及原型系统开发[D].浙江大学,2014.
[47]沈阳武,彭晓涛,施通勤,毛荀,孙元章.基于最优组合权重的电能质量灰色综合评价方法[J].电力系统自动化,2012,10:67-73.
[48]苗利.非晶硅平板探测器(a-Si EPID)在放射治疗剂量验证中的应用研究[D].苏州大学,生物医学工程,2013,硕士.
[49]尚承林.吉林大学高水平运动员培养现状调查与分析[D].吉林大学,体育教学,2014,硕士.
[50]张晓龙.脑卒中患者急性期血尿酸与短期预后的关系[D].苏州大学,流行病与卫生统计学,2012,硕士.

相关推荐
更多